未經審查模型
一般來說模型在進行訓練的時候,工作人員會提供相當大量的資料檔案來做訓練,有些資料內容比較具有爭議性像是:性、毒品、色情、戰爭、人種這些議題。因此在發布的時候就會將這些資料想辦法排除在外。
舉個例來說,台灣 TAIDE 推出了一個 Llama3-TAIDE 模型。在訓練方式的欄位就有特別告知說,在進行資料前處理的時候,會先「去除不當文字,如賭博、色情等」以及「去除個資,如 email、電話」這些步驟。
所以,Llama3-TAIDE 這個模型就是「經過審查」;反之,沒有做這些處理的模型就稱為 uncensored。
Reference
- Llama3-TAIDE-LX-8B | Huggingface
- llama2-uncensored | Site